编码, 比特序列, 编码规则, 进制
- 编码
- 比特序列
- 编码规则
- 二进制
- 十六进制
编码(Encoding)是将信息从一种形式(如字符、数字、符号)转换为另一种形式(如二进制序列)的过程,通常是为了便于存储、传输、处理或兼容不同系统。编码过程是可逆的,接收方可通过解码将信息还原为原始形式。常见编码方式包括字符编码(如ASCII、UTF-8)、数据压缩编码(如Base64)、音视频编码(如MP3、H.264)等。
在计算机系统中,所有信息归根结底都需编码成二进制(binary),即由0和1组成的比特序列,这是计算机唯一可直接处理的数据格式。
比特序列(Bit Sequence)是信息编码之后的最终表现方式。例如“A”编码为ASCII码的“65”,然后以8位二进制“01000001”表示,这就是“比特序列”。所有数字、字符、图片、声音在计算机中都最终以比特序列存在。
编码规则是指将信息转换为比特序列的具体方法和标准。不同编码规则定义了不同的映射关系和格式。例如,ASCII编码规定了128个字符对应的7位二进制值,而UTF-8则支持更多字符并使用可变长度编码。选择合适的编码规则对于确保信息正确传输和处理至关重要。
二进制(Binary)是一种数值表示系统,使用两个符号“0”和“1”来表示所有数值和信息。在计算机科学中,二进制是基础,因为计算机的电子电路只能识别两种状态(如高电平和低电平)。通过组合多个二进制位(bit),可以表示更大的数值和复杂的信息。例如,8位二进制可以表示从0到255的整数。二进制不仅用于数值表示,还广泛应用于数据存储、处理和传输等各个方面。

二进制也可以表示小数,方法类似于十进制,只是每一位的权重是 (小数点右边第n位)。
大多数十进制小数在二进制表示下是无限循环小数,只能用有限位近似,导致计算机运算中会发现小数误差和舍入问题,这也是编程和科学计算里常见的“浮点数精度误差”。

十六进制(Hexadecimal)是一种数值表示系统,使用16个符号(0-9和A-F)来表示数值。它是二进制的简洁表示方式,因为每个十六进制位可以表示4个二进制位(bit)。例如,二进制“1111”对应十六进制“F”,二进制“1010”对应十六进制“A”。

为什么采用十六进制
- 二进制太长,不利于人类阅读和交流,十六进制是简短且方便查看的表示法,因此被广泛用于编程、内存地址、机器码展示等场合。
- 但在底层运算、存储、数据交换环节,所有以十六进制表示的信息最终都会回归为“0”和“1”的比特序列。